2021-06-10

Accessibilité aux personnes en situation de handicap

Une étude critique du respect du cadre juridique d’accessibilité aux handicapés

Scorer et classifier les établissements pouvant accueillir les personnes en situations de handicap

Livrables

Documentation

Revue de littérature, quasi-nullité d’exploitations RES + Handicap

Bibliographie complète du RES

Un seul document sur 81 qui mentionne “handicap” dans le titre

Hypothèses

  • Il ne s’agit pas d’un projet juridique, l’objectif n’est donc pas d’étudier le cadre juridique des normes d’accessibilité en France.
  • On se propose pas la suite de comparer les établissements en termes d’accessibilité afin de permettre d’identifier les établissements défaillants.

Avertissement - Qualité des données

Tout projet de data-science devrait commencer par une analyse de la qualité des données.

  • Données mal codées :
    • Ordre permuté dans les listes (Type d’utilisation, Types de locaux complémentaires…)
    • Espaces en trop (Période de mise en service : 1975-1984 vs 1975 - 1984)
    • Variable numérique (Emprise foncière de l’installation : des espaces, des points, des virgules, des m², m2, hectares, ha…)
  • Données incertaines : variable “Etat de la fiche d’enquête”, modalité non-validée.

Distribution des établissements par famille d’équipement sportif

Variables qualifiant l’accessibilité

Choix des critères d’accessibilité

On s’intéresse en priorité aux critères bien renseignés (taux de valeurs manquantes faible).

On peut distinguer le sport comme pratique ou comme spectacle.

En matière de santé publique, l’accès à la pratique prévaut.

Par ailleurs la proportion des établissements “accessibles” dans l’ensemble est un élément important.

On distingue un écart colossal d’accessibilité aux handicapés moteurs (55%) vs sensoriels (3%)

On retrouve cette séparation des handicaps sensoriels vs moteurs dans la CAH des corrélations.

Corrélation entre les critères d’accessibilité - séparation nette moteur / sensoriel

Choix de la problématique

Les écarts d’accessibilité à la pratique sportive aux handicapés moteurs vs sensoriels

  • Accessibilité aux personnes à mobilité réduite à l’aire de jeu
  • Accessibilité aux personnes en situation de handicap sensoriel à l’aire de jeu

Les handisports (1/2)

Les handisports (2/2)

Des activités adaptées aux handicapés moteurs ou sensoriels

  • Ski
  • Natation
  • Canoë
  • Tir
  • Danse
  • Musculation
  • Athlétisme

Accessibilité par famille d’établissement

Des taux d’accessibilités très variables d’une famille d’équipement à l’autre.

Accessibilité par type d’établissement

Des taux d’accessibilités très variables d’un type d’équipement à l’autre.

Des variables spécifiques par type d’établissement

Athlétisme, ski, natation, activités aquatiques & aériennes.

Une amélioration progressive du respect des normes d’accessibilité

Mesuré avec un modèle logistique sur 9530 équipements d’athlétisme.

Approche généraliste

Pour continuer d’appréhender les données, on entraîne des modèles généralistes sur les variables communes aux différents types d’équipements.

Faute de temps pour tout explorer, on se concentre sur l’accessibilité aux aires de jeu pour les handicapés moteurs.

Pour tenir compte de toute la diversité des ES on construit le jeu d’entraînement de 100,000 observations par tirage stratifié par famille d’ES.

Objectif

Fournir au bureau compétant un outil d’aide à la décision pour identifier les “mauvais élèves” ie non accessibles alors que les établissements similaires sont plutôt accessibles.

Fournir au site https://www.handiguide.sports.gouv.fr/ une liste des “bons élèves” ie les établissements accessibles malgré la pauvreté de l’offre dans les établissements similaires.

Pour aller plus loin, on pourrait fournir un outil de recherche d’alternative (complémentaire à https://www.handiguide.sports.gouv.fr/) qui permet de voir tous les ES par famille > type puis 1) trouver facilement les établissements accessible par handicap 2) référencer ceux qui ne le sont pas et mettre un lien direct pour leur envoyer un email demandant la mise aux normes (champ Email de la personne ressource + web-scrapping). Le lien ici

Feature Engineering

En plus de la correction des variables multi-catégorielles et numériques mal codées, on remplace également certaines variables multi-modales par la valeur moyenne de la cible calculée sur le jeu d’entraînement pour éviter le data leakage.

Le taux d’accessibilité moyen par famille d’établissement donne une AUC à 67.8% (sur les données de test).

Arbres de décision - AUC 71.7%

Permet de continuer de découvrir des variables mal codées et d’identifier en priorité les variables les plus pertinentes.

2-Step GLM modalités significatives - AUC 73.3%

Modèle de référence en termes d’interprétabilité.

Gradient boosting (GBM) - AUC 74.1% (1/2)

Inteprétation de la contribution des variables pour les erreurs les plus extrêmes (SHAPLEY répartition des contributions)

Gradient boosting (GBM) (2/2)

  • Pas de parking handicapé : contribution négative
  • Lieu bien équipé : sanitaires, vestiaires chauffés, salle de cours, locaux complémentaires.
  • Et pourtant non accessible aux handicapés moteurs.

Extreme Gradient Boosting (XGBoost) - AUC 80.0%

Params :

  • sample rows : 70%
  • sample cols : 50%
  • eta : 0.1
  • min_child_weight : 10 (>10 obs par feuille)
  • max-depth : 6
  • nb_trees : 1500

On pourrait

  • améliorer avec une grid-search (BayesianSearch ? l’entraînement est quand même lent !)
  • ajouter des contraintes de monotonie, en particulier sur les variables de target-encoding
  • créer de nouvelles features, à commencer par un target encoding plus complet (quand il y a trop peu d’observations…)
  • recoder les variables numériques en déciles (factor) pour intepréter plus facilement les waterfalls.

Extreme Gradient Boosting (XGBoost) - Waterfall (1/2)

Interprétation à l’aide d’un diagramme waterfall en triant les contributions en valeur absolue grâce à xgboostExplainer

Extreme Gradient Boosting (XGBoost) - Waterfall (2/2)

Un outil pour trouver les établissements accessibles

L’outil

  • Identifier les établissements accessibles par catégorie
  • Identifier ceux qui ne sont pas accessibles et les contacter (adresse email dans le popup)
  • Pour améliorer :
    • intégrer le score pour qualifier les bons/mauvais élèves. API plumber ou variable prédiction.
    • ajouter des données externes
    • meilleure UX pour le choix famille > type d’établissement
    • alternative à la recherche par département : rayon de XX km autour d’un point placé sur la carte
    • intégrer d’autres handicaps